智能论文笔记

Predicting article quality scores with machine learning: The UK Research Excellence Framework

Mike Thelwall , Kayvan Kousha , Mahshid Abdoli , Emma Stuart , Meiko Makita , Paul Wilson , Jonathan Levitt , Petr Knoth , Matteo Cancellieri

分类：人工智能

2022-12-11

National research evaluation initiatives and incentive schemes have previously chosen between simplistic quantitative indicators and time-consuming peer review, sometimes supported by bibliometrics. Here we assess whether artificial intelligence (AI) could provide a third alternative, estimating article quality using more multiple bibliometric and metadata inputs. We investigated this using provisional three-level REF2021 peer review scores for 84,966 articles submitted to the UK Research Excellence Framework 2021, matching a Scopus record 2014-18 and with a substantial abstract. We found that accuracy is highest in the medical and physical sciences Units of Assessment (UoAs) and economics, reaching 42% above the baseline (72% overall) in the best case. This is based on 1000 bibliometric inputs and half of the articles used for training in each UoA. Prediction accuracies above the baseline for the social science, mathematics, engineering, arts, and humanities UoAs were much lower or close to zero. The Random Forest Classifier (standard or ordinal) and Extreme Gradient Boosting Classifier algorithms performed best from the 32 tested. Accuracy was lower if UoAs were merged or replaced by Scopus broad categories. We increased accuracy with an active learning strategy and by selecting articles with higher prediction probabilities, as estimated by the algorithms, but this substantially reduced the number of scores predicted.

translated by 谷歌翻译

Transformers Improve Breast Cancer Diagnosis from Unregistered Multi-View Mammograms

Xuxin Chen , Ke Zhang , Neman Abdoli , Patrik W. Gilley , Ximin Wang , Hong Liu , Bin Zheng , Yuchen Qiu

分类：计算机视觉 | 人工智能

2022-06-21

深度卷积神经网络（CNN）已被广泛用于各种医学成像任务。但是，由于卷积操作的内在局部性，CNN通常不能很好地对远距离依赖性进行建模，这对于准确识别或映射从未注册的多个乳房X线照片计算出的相应乳腺病变特征很重要。这促使我们利用多视觉视觉变形金刚的结构来捕获一项检查中同一患者的多个乳房X线照片的远程关系。为此，我们采用局部变压器块来分别学习从两侧（右/左）乳房的两视图（CC/MLO）获得的四个乳房X线照片中。来自不同视图和侧面的输出被串联并馈入全球变压器块，以共同学习四个代表左乳房和右乳房两种不同视图的图像之间的贴片关系。为了评估提出的模型，我们回顾性地组装了一个涉及949套乳房X线照片的数据集，其中包括470例恶性病例和479例正常情况或良性病例。我们使用五倍的交叉验证方法训练和评估了模型。没有任何艰苦的预处理步骤（例如，最佳的窗户裁剪，胸壁或胸肌去除，两视图图像注册等），我们的四个图像（两视频两侧）基于变压器的模型可实现案例分类性能在ROC曲线下的面积（AUC = 0.818），该区域的表现明显优于AUC = 0.784，而最先进的多视图CNN（p = 0.009）实现了0.784。它还胜过两个单方面模型，分别达到0.724（CC视图）和0.769（MLO视图）。该研究表明，使用变压器开发出高性能的计算机辅助诊断方案，这些方案结合了四个乳房X线照片。

translated by 谷歌翻译

Knowledge Distillation for Multi-Target Domain Adaptation in Real-Time Person Re-Identification

Félix Remigereau , Djebril Mekhazni , Sajjad Abdoli , Le Thanh Nguyen-Meidine , Rafael M. O. Cruz , Eric Granger

分类：计算机视觉

2022-05-12

尽管深度学习架构最近取得了成功，但在现实词应用程序中，人重新识别（REID）仍然是一个具有挑战性的问题。最近，已经提出了几种无监督的单目标域适应性（STDA）方法，以限制源和目标视频数据之间通常发生的域移位引起的REID准确性下降。鉴于人REID数据的多模式性质（由于跨摄像头观点和捕获条件的变化），训练常见的CNN主链来解决跨多个目标域的域移动，可以为实时REID应用程序提供有效的解决方案。尽管在REID文献中尚未广泛解决多目标域的适应性（MTDA），但一种直接的方法包括混合不同的目标数据集，并在混合物上执行STDA以训练公共CNN。但是，这种方法可能导致概括不佳，尤其是在融合越来越多的不同目标域来训练较小的CNN时。为了减轻此问题，我们基于知识蒸馏（KD-REID）引入了一种新的MTDA方法，该方法适用于实时人员REID应用。我们的方法通过从多个专业的教师CNN中蒸馏出来，适应了目标域上常见的轻型学生骨干CNN，每个CNN都适用于特定目标域的数据。对几个具有挑战性的人REID数据集进行的广泛实验表明，我们的方法优于MTDA的最先进方法，包括混合方法，尤其是在训练像OSNET这样的紧凑型CNN骨架时。结果表明，我们的灵活MTDA方法可用于设计成本效益的REID系统，以实时视频监视应用程序。

translated by 谷歌翻译

Ergo, SMIRK is Safe: A Safety Case for a Machine Learning Component in a Pedestrian Automatic Emergency Brake System

Markus Borg , Jens Henriksson , Kasper Socha , Olof Lennartsson , Elias Sonnsjö Lönegren , Thanh Bui , Piotr Tomaszewski , Sankar Raman Sathyamoorthy , Sebastian Brink , Mahshid Helali Moghadam

分类：机器学习

2022-04-16

关键应用程序中机器学习（ML）组件的集成引入了软件认证和验证的新挑战。正在开发新的安全标准和技术准则，以支持基于ML的系统的安全性，例如ISO 21448 SOTIF用于汽车域名，并保证机器学习用于自主系统（AMLAS）框架。 SOTIF和AMLA提供了高级指导，但对于每个特定情况，必须将细节凿出来。我们启动了一个研究项目，目的是证明开放汽车系统中ML组件的完整安全案例。本文报告说，Smikk的安全保证合作是由行业级别的行业合作的，这是一个基于ML的行人自动紧急制动示威者，在行业级模拟器中运行。我们演示了AMLA在伪装上的应用，以在简约的操作设计域中，即，我们为其基于ML的集成组件共享一个完整的安全案例。最后，我们报告了经验教训，并在开源许可下为研究界重新使用的开源许可提供了傻笑和安全案例。

translated by 谷歌翻译

Machine Learning Testing in an ADAS Case Study Using Simulation-Integrated Bio-Inspired Search-Based Testing

Mahshid Helali Moghadam , Markus Borg , Mehrdad Saadatmand , Seyed Jalaleddin Mousavirad , Markus Bohlin , Björn Lisper

分类：人工智能 | 机器学习 | 神经与进化计算

2022-03-22

本文介绍了更深层的扩展版本，这是一种基于搜索的仿真集成测试解决方案，该解决方案生成了用于测试基于神经网络的巷道式泳道系统的检测失败测试方案。在新提出的版本中，我们使用了一组新的生物启发的搜索算法，遗传算法（GA），$（{\ mu}+{\ lambda}）$和$（{\ mu}，{\ mu}，{\ lambda}），{\ lambda}） $进化策略（ES）和粒子群优化（PSO），利用了针对用于对测试场景进行建模的演示模型量身定制的优质人口种子和特定于域的交叉和突变操作。为了证明更深层次的新测试生成器的功能，我们就SBST 2021的网络物理系统测试竞赛中的五个参与工具进行了经验评估和比较。我们的评估显示了新提出的测试更深层次的发电机不仅代表了先前版本的可观改进，而且还被证明是有效和有效地引发相当数量的不同故障的测试方案，用于测试ML驱动的车道保存系统。在有限的测试时间预算，高目标故障严重性和严格的速度限制限制下，它们可以在促进测试方案多样性的同时触发几次失败。

translated by 谷歌翻译

Time Series Data Mining Algorithms Towards Scalable and Real-Time Behavior Monitoring

Alireza Abdoli

分类：机器学习 | 人工智能

2021-12-26

近年来，传感器技术中有前所未有的技术进步，传感器变得比以往任何时候都更实惠。因此，传感器驱动数据收集越来越多地成为全球研究人员的吸引力和实用的选择。这些数据通常以时间序列数据的形式提取，这可以用数据挖掘技术来研究，以总结一系列受试者的行为，包括人类和动物。虽然启用廉价和质量收集数据，但连续传感器数据记录在大小和体积中大的数据集，这是在及时处理和分析传统技术的具有挑战性。这种收集的传感器数据通常以时间序列数据的形式提取。文献中有两种主要方法，即基于形状的分类和基于特征的分类。基于形状的分类根据距离测量确定最佳类。另一方面，基于功能的分类，根据时间序列定义的功能，找到时间序列的属性并找到最佳类。在本文中，我们证明这两种技术都不会使一些问题占主导地位，但两者都可能是最好的。换句话说，在一个问题上，可能的技术可以更好地对行为的一个子集更好，而另一技术对于另一个行为的子集更好。我们介绍了一种混合算法来分类行为，使用两个形状和特征措施，在从传感器收集的弱标记时间序列数据中，以量化由受试者执行的特定行为。我们展示了我们的算法可以基于形状和特征的组合，强大地分类真实，嘈杂和复杂的数据集，并在现实世界数据集中测试了我们所提出的算法。

translated by 谷歌翻译

Image Inpainting Using AutoEncoder and Guided Selection of Predicted Pixels

Mohammad H. Givkashi , Mahshid Hadipour , Arezoo PariZanganeh , Zahra Nabizadeh , Nader Karimi , Shadrokh Samavi

分类：计算机视觉

2021-12-17

图像染色是增强扭曲数字图像的有效方法。不同的初始化方法使用相邻像素的信息来预测丢失像素的值。最近，深度神经网络已经用于学习图像的结构和语义细节以获得避免目的。在本文中，我们提出了一种用于图像染色的网络。此网络类似于U-Net，从图像中提取各种功能，导致更好的结果。我们通过用输出图像的恢复像素替换损坏的像素来改善最终结果。我们的实验结果表明，该方法产生了与传统方法相比的高质量结果。

translated by 谷歌翻译

Shape-Dependent Multi-Weight Magnetic Artificial Synapses for Neuromorphic Computing

Thomas Leonard , Samuel Liu , Mahshid Alamdar , Can Cui , Otitoaleke G. Akinola , Lin Xue , T. Patrick Xiao , Joseph S. Friedman , Matthew J. Marinella , Christopher H. Bennett

分类：神经与进化计算

2021-11-22

在神经形态计算中，人工突触提供了一种基于来自神经元的输入来设置的多重导电状态，类似于大脑。可能需要超出多重权重的突触的附加属性，并且可以取决于应用程序，需要需要从相同材料生成不同的突触行为。这里，我们基于使用磁隧道结和磁畴壁的磁性材料测量人造突触。通过在单个磁隧道结下面的畴壁轨道中制造光刻槽口，我们实现了4-5个稳定的电阻状态，可以使用自旋轨道扭矩电气可重复控制。我们分析几何形状对突触行为的影响，表明梯形装置具有高可控性的不对称性重量，而直线装置具有较高的随机性，但具有稳定的电阻水平。设备数据被输入到神经形态计算模拟器中以显示特定于应用程序突触函数的有用性。实施应用于流式的时尚 - MNIST数据的人工神经网络，我们表明梯形磁突出可以用作高效在线学习的元塑功能。为CiFar-100图像识别实施卷积神经网络，我们表明直流突触由于其电阻水平的稳定性而达到近乎理想的推理精度。这项工作显示多重磁突触是神经形态计算的可行技术，并为新兴人工突触技术提供设计指南。

translated by 谷歌翻译